Bearbeiten ◦ Ausgeben ◦ Eingeben ◦ Bewerten ◦ Verbessern ◦ Analysieren ◦ ?
Die Aufgabenanalyse untersucht die Qualität einzelner Aufgaben und die Testanalyse jene des Gesamttests. Die Kennzahlen des nächsten Abschnitts begleiten in erster Linie die Benotung, tragen aber ebenfalls zur Qualitätssicherung der Aufgabenbank bei.
Ermittelt man für jeden Teilnehmer das Punktetotal, so entsteht eine Häufigkeitsverteilung, die jedem Punktwert oder jedem Punktintervall die Zahl der TeilnehmerInnen mit diesem Punkt oder Intervall zuordnet. Die Häufigkeitsverteilung beschreibt die Gesamtleistungen der Teilnehmer vollständig, ist aber unübersichtlich. Man wird ihre Information deshalb durch Lage- und Verteilungsparameter verdichten:
Die verbreitetsten Lageparameter sind Mittelwerte. Ein Mittelwert beschreibt einen typischen Wert der Häufigkeitsverteilung. Mögliche Mittelwerte sind der Modus (der häufigste Wert), der Median (der Wert, der die Häufigkeitsverteilung in zwei gleich grosse Teile trennt) und das ungewichtete arithmetische Mittel x (der Durchschnitt).
Ein Mittelwert beschreibt eine Häufigkeitsverteilung umso schlechter, je stärker die Einzelwerte von ihm abweichen. Man versucht deshalb, diese Abweichung durch ein Streuungsmass zu quantifizieren. Die Spannweite (range) misst zum Beispiel die Entfernung zwischen dem kleinsten und grössten Wert der Häufigkeitsverteilung. Die mittlere Abweichung begnügt sich nicht mit zwei Werten, sondern berechnet den Durchschnitt der Abweichungen aller Werte von einem Mittelwert. Das verbreitetste Streuungsmass, die mittlere quadratische Abweichung (Standardabweichung, wollen wir vertiefen:
Die Standardabweichung ist weniger anschaulich als die mittlere Abweichung, hat aber theoretische Vorzüge. Um zu verhindern, dass sich positive und negative Abweichungen ausgleichen, werden die Abweichungen quadriert. Das Quadrieren gewichtet ausserdem grössere Abweichungen stärker als kleine. Allerdings werden nicht nur Werte sondern auch die damit verbundenen Masseinheiten quadriert (m werden zum Beispiel zu m2). Man macht die Quadrierung der Masseinheiten deshalb durch das Ziehen der Quadratwurzel "rückgängig". Die Formel der Standardabweichung lautet deshalb:
Ö S(x-x)2 / n (Das Wurzelzeichen erstreckt sich über die ganze Formel).
Die Form der Häufigkeitsverteilung beeinflusst ihre Interpretation. Wenn man annimmt, dass die Leistungsfähigkeit von Testteilnehmern - wie viele rein biologische Merkmale - normalverteilt ist, dann ergibt sich die folgende Interpretation:
Etwa 2/3 der Testwerte sind höchstens eine Standardabweichung vom arithmetischen Mittel entfernt.
Etwa 95% der Testwerte liegen zwischen zwei Standardabweichungen.
Etwa 99 3/4% der Testwerte liegen zwischen drei Standardabweichungen.
Daraus leiten einzelne Pädagogen ein Benotungsmodell ab, das innerhalb einer Teststichprobe die Punkte so verteilt, dass die Notenhäufigkeiten ungefähr normalverteilt sind. Der grösste Nachteil dieses Benotungsmodells ist seine Ungerechtigkeit aus der Sicht der Bewerteten. Es führt nämlich dazu, dass je nach der Position zweier Teilnehmer auf der Normalverteilung gleichen Punktedifferenzen ungleiche Benotungsdifferenzen zugeordnet werden. Zum Beispiel kann sich die folgende Konstellation ergeben:
A und B haben die Punktetotale 30 und 50 und erhalten die Noten 3 und 4.
C und D haben die Punktetotale 80 und 100, erhalten aber die Noten 5.5 und 6.
Obwohl die Punkteunterschiede für die Paare [A, B] und [C, D] gleich gross sind, ist der Notenunterschied für das erste Paar zweimal grösser als beim zweiten Paar. TESTS verwendet deshalb ein lineares statt ein normalverteiltes Benotungsmodell (siehe Notenvergabe).